시각적인 설명
2012년에 독서 모임에서 읽은 책.
책 소개
워낙 유명한 책이라 오래전에 사뒀는데 그간 발췌독만 하다가 공부모임 덕에 드디어 다 정독을 했다.
정보시각화를 다루는 책답게 편집에 많은 공을 들인 게 인상적이었다. 이를테면 거의 모든 삽화와 주석이 해당 삽화 혹은 주석과 관련된 문장의 바로 옆이나 아래에 배치되어 있어서 책장을 앞뒤로 오가며 읽을 필요가 없게 되어 있다. 심지어는 특정 삽화에 대한 설명이 한 페이지에서 끝나지 않는 경우 다음 페이지에 같은 삽화가 다시 나오기도 한다(이를테면 Salyut 6의 Cyclogram). 혹은 중요한 이미지는 원본을 최대한 그대로 살리려 노력하고 있는데, 이를테면 John Snow의 콜레라 지도는 원본 크기를 그대로 수록하고 있다.
공학, 의학, 건축, 마술, 천문학, 천체물리학, 컴퓨터 과학, 타이포그라피, 예술, 17세기 영문학 등 워낙 다양한 분야의 예시를 다루고 있기도 하고, 일반적인 기술 서적이나 교양 과학 서적과 달리 문학적인 표현이 많아서 읽기가 쉽지 않았다.
책 곳곳에서 이런저런 부적절한 시각화 사례를 인용하며 굉장히 날카롭고 꼼꼼하고 깐깐하고 신랄하고 냉소적이면서 유머러스하게 비판하고 있는데 저자의 성격이 드러나는 것 같은 느낌이다.
서문
서문에서는 책의 전체적인 주제와 구성을 설명하고 있다. 이 책의 가장 중요한 주제는 “동사(verbs)“라고 한다. 즉 변화와 움직임, 인과 관계 등을 효과적으로 시각화하는 방법을 주로 다루고 있다.
1장 - Images and Quantities
앞부분에서는 시각화(Data visualization)의 역사를 간략히 소개한다. 다양한 데이터를 2차원 평면인 종이 위에 담아내기 위한 초창기 시도들이 인상 깊었다.
실제 세상을 단순화하고 축소하여 그려낸 지도에서 시작해서, 추상적인 데카르트 평면의 X,Y 좌표상에 “임의의” 숫자를 대입할 수 있음을 발견하기 위해 5,000년이 걸렸다는 점도 재미있었다.
뒷부분에서는 수치 혹은 실제 대상을 추상적 혹은 재현적인 이미지로 변환하는 과정에서 일어나는 손실이나 왜곡을 이야기한다. 실제 예술 작품을 책 등에 담아내는 과정에서 일어나는 절대적/상대적 크기의 상실이라거나, 많은 과학적 시각화에서 원래 데이터에는 존재하던 수량 정보를 적절히 담아내지 못해서 일어나는 반수량화(dequantification) 등을 예로 들고 있다. 수치 데이터를 시각화하는 과정에서 발생할 수 있는 반수량화는 저자가 가장 경계하는 문제 중 하나이다.
반대로, 어떠한 경우에는 적절한 왜곡/변환을 통해 패턴을 더 잘 드러낼 수도 있다. 이를테면 일반적인 꺾은선 그래프 등에서 Y축을 축소함으로써 추세를 더 잘 볼 수 있게 되는 경우가 있다.
2장 - Visual and Statistical Thinking: Displays of Evidence for Making Decisions
2장에서는 두 가지 사례를 통해 의사결정을 돕기 위한 효과적인 시각화란 어떠해야 하는지를 설명한다.
첫 번째 사례는 1854년에 있었던 런던의 콜레라 창궐이다. John Snow는 일반적인 일별 사망자 수 그래프 대신 지도 위에 사망자의 위치 및 콜레라의 원인으로 추정되는 공공 펌프 시설을 표시함으로써, 자신의 가설(콜레라는 오염된 식수원을 통해 전염됨)을 지지하는 증거를 설득력 있게 드러낼 수 있었다. 요즘 말로 하면 Geovisualization 이다.
저자는 특히 다음과 같은 네 가지 접근법이 주요했다고 평가한다.
- 첫째, 인과 관계를 잘 드러낼 수 있는 방식(펌프와 사망자 위치가 표시된 지도)으로 시각화하였다.
- 둘째, 단순히 “사망자가 많다”가 아니라 “무엇과 비교하여 많은가?”라는 질문에 답할 수 있는 형태로 증거가 제시되었다. 정량적 비교는 과학적/통계적 사고의 핵심이며 시각화 역시 정량적 비교를 담고 있어야 한다.
- 셋째, 드러난 사실에 대한 다른 설명이 가능한지 고민하였으며, 자신의 가설과 반대되는 것으로 보이는 사실도 지나치지 않고 꼼꼼한 조사를 하여 가설의 신뢰성을 높였다.
- 넷째, 데이터가 정확할 것으로 가정하고 넘어가지 않고 존재할 가능성이 있는 오류들(이를테면 이사를 간 경우 등)에 대해서도 주의 깊게 평가하고 있다. 요즘 말로 하면 데이터 클랜징이라고 할 수 있겠다.
두 번째 사례는 1986년 1월 28일에 있었던 우주왕복선 폭발 사고이다. 사고를 예측할 충분한 근거가 있었고 담당 엔지니어들이 미리 경고를 했음에도 부적절한 설명 및 시각화(그리고 관료주의 등) 때문에 폭발 사고가 일어났다(물론 “시각화 때문에”라는 식의 과장된 서술은 당연히 이 책이 시각화에 대한 책이기 때문으로 이해해야 하겠지만).
- 작성자 혹은 작성 기관을 명시하지 않아서 신뢰를 잃은 점
- 의사결정과 관련 없는 불필요한 데이터를 넣어서 혼란을 가중시킨 점
- 의사결정과 관련된 모든 데이터를 나타내지 않고 일부 데이터만 나타내는 바람에 올바른 의사결정을 방해한 점
- 불필요하게 상세한 데이터를 담는 바람에 문제를 오히려 분산시킨 점
등을 지적하고 있다.
사고 이후에 청문회용으로 작성된 자료 역시 비판하고 있는데, 불필요한 꾸밈 요소가 많아서 필요한 정보가 묻힌 점, 여전히 의사결정과 관련된 데이터의 극히 일부만 보고서에 포함된 점 등의 문제가 있었다.
정보시각화를 할 때에도 과학적/통계적 추론과 같은 원칙이 적용되어야 하고, 이를 평가할 때에도 같은 수준의 깐깐함이 필요하다는 점을 강조하고 있다. 아마 다음 문장이 2장의 결론일 것 같다:
Visual representations of evidence should be governed by principles of reasoning about quantitive evidence. For information displays, design reasoning must correspond to scientific reasoning. Clear and precise seeing becomes as one with clear and precise thinking. —p53
3장 - Explaining Magic: Pictorial Instructions and Disinformation Design
3장에서는 마술 책에 대해 이야기한다. 마술 책은 두 가지 의미에서 이 책의 주제와 관련이 있다.
첫째, 마술 책은 시간의 흐름에 따른 마술사의 퍼포먼스를 시각적으로 설명해야 하는데 이때 퍼포먼스는 사실 두 가지 측면으로 이루어진다. 하나는 관객에게 드러내야 하는 부분, 다른 하나는 관객에게 숨기고 마술사만 알아야 하는 부분이다. 즉 굉장히 복잡한 정보(시간의 흐름, 관객에게 드러나는 움직임, 관객에게 숨겨야 하는 움직임)를 담아내야 한다는 측면에서 배울 점이 많다.
둘째, 마술사들이 관객을 속이기 위해서는 실제로 일어나는 일 일부를 감추어야 하는데 이때 쓰이는 기법들로부터 우리가 디자인 할 때 하지 말아야할 것들을 유추할 수 있다. 즉, 어떻게 하면 정보가 효과적으로 숨겨지는지를 공부하고 이를 적극 피해야 한다는 것이다(disinformation design이라고 부름).
마술 이야기 다음에는 잘못된 정보를 효과적으로 드러내는 사례들을 몇 가지 다룬다. 즉, 정보를 효과적으로 드러내고 있는가도 중요하지만 그 전에 정보가 올바른가도 중요하다는 이야기를 하고 싶었던 것 같다.
마술 책에 수록된 각종 일러스트레이션 이야기 말고도, 마술사의 행위(무대 위에서의)에 대한 이야기도 하고 있다. PT 하거나 강연할 때 배울 점이 많다는 것.
3장에서 강조하는 바:
- 애초에 정보가 올바른가
- 그 정보가 적절히 표현되었는가
- 모든 데이터가 빠짐없이 잘 서술되었는가
- 오독을 방지하도록 표현되었는가
- 적절한 맥락과 비교 대상이 제시되고 있는가
4장 - The Smallest Effective Difference
Smallest effective difference란 차이를 효과적으로 인식할 수 있는 최소한이라는 뜻인데, 예를 들어 회색과 검은색으로 구분해도 충분한 걸 굳이 빨간색과 파란색으로 구분하는 짓을 하지 말라는 이야기이다. 구분 가능한 최소한의 차이만으로 시각화하라는 일종의 원칙(principle)이다. 저자의 비유에 의하면 이는 과학에서 “오캄의 면도날”과 비슷한 개념이라고 한다. 지각과 관련된 분야(지각심리, 생리물리 등)에서는 Just-noticeable differences라는 용어가 있는데 이와 유사하다. 물론 저자가 말하는 최소한의 효과적인 차이란 jnd 보다는 크다. 실제로 저자는 이 표현을 살짝 바꿔서, 시각화에서는 just notable differences 가 중요하다고 말하고 있다.
저자의 정의는 다음과 같다:
Make all visual distinctions as subtle as possible, but still clear and effective. —p73
다른 말로 표현해보자면 희소한 시각적 자원을 낭비하지 말고 아껴쓰자는 말로 이해할 수도 있겠다. 인간이 쉽게 구분하고 기억해낼 수 있는 색은 10개 이내이니 색을 굳이 쓰지 않아도 되는 상황이라면 같은 색에서 명도 차이만 주는 것이 좋고, 선의 굵기 차이만으로 레이어의 차이를 드러낼 수 있으면 다른 시각적 장치는 안 쓰는 것이 좋고 등.
이런 식으로 아끼면 뭐가 좋을까? 재료(시각적 자원)가 남기 때문에 자유도가 늘어난다. 차트에 새로운 차원을 추가해야 하거나, 정말 강조하고 싶은 뭔가가 생겼을 때 등 디자이너로서의 운신의 폭이 넓어지는 것이다. 혹은, 정보를 담는 그릇이 달라지는 경우(이를테면 신문 인쇄를 위해 단색으로 바꿔야 하거나, 모바일 기기의 작은 화면에 담아야 한다거나 등)에도 더 여유롭게 대처할 수 있을 것이다.
5장 - Parallelism: Repetition and Change, Comparison and Surprise
5장에서는 유사한 형태의 시각화를 (주로) 공간상에 병치하여 2차원 평면의 제약을 넘어 표현 가능한 차원의 수를 늘리는 방법을 소개하고 있다. 5장의 제목에 나열된 단어들(반복, 변화, 비교, 놀라움)은 (아마도 단순 “데이터”와 대비되는 의미에서) “정보”를 구성하는 핵심 요소들이다.
두 개 혹은 그 이상의 이미지를 근접하게 병치함으로써 보는 이가 각 이미지 사이의 유사성, 차이점 등을 능동적으로 비교할 수 있도록 유도할 수 있다. 꼭 이미지끼리의 병치가 아니더라도 다양한 활용이 가능하다. 예를 들면 평면의 좌측에는 다양한 각도의 정육면체들을 특정한 배열로 나열하고, 평면의 우측에는 정육면체들과 같은 배열로 각 정육면체에 대응되는 다양한 수치들을 나열하는 식의 표현도 가능하다. 이렇게 하면 특정 정육면체에 대하여 시각적 인식 및 정확한 수치 읽기가 가능해진다. 또 다른 재미난 사례로, 성악을 연주하면서 음악의 진행과 함께 독일어 가사 및 영어 해석이 화면에 표시되는 형식의 사용자 인터페이스를 소개하고 있다. 이 경우 시간의 흐름을 기준으로 소리(음악)와 두 쌍의 텍스트(독어, 영어)가 병렬 구조를 이루며 전개되는 것이다.
뒷부분에서는 부적절한 병치의 사례를 소개하고 이를 비판하고 있다.
6장 - Multiples in Space and Time
6장의 주제는 “Multiples”이다. 앞 장에서 소개한 병치와 유사하게 여러 이미지를 나열하여 반복, 변화, 패턴, 예기치 못한 놀라움 등을 드러내는 기법이다. 멀티플은 시간의 흐름에 따른 움직임을 2차원 공간상에 펼쳐서 보여줄 때 특히 유용하다. 6장의 내용은 자연스럽게 5장의 내용과 이어진다(6장의 첫 문장은 5장의 제목과 거의 같다).
지구와 토성의 상대적 위치에 따라 토성의 고리가 다르게 보이는 이유를 설명하기 위해 효과적으로 멀티플을 활용한 예(C. Huygens, 1659), 판게아가 현재의 대륙으로 변화되는 과정(대륙이동설)을 표현한 예(A. Wegener, 1929), 사람의 역동적인 움직임을 영화 필름처럼 단계적으로 촘촘하게 표현한 예(E. Muybridge, 1887) 등을 소개하고 있다. 이 세 가지 예를 통해 강조하고자 하는 바 중 하나는 움직임의 속도나 움직임의 규칙성 등에 따라 얼마나 촘촘한 표현이 필요한지가 다르다는 점이다. 이를테면 태양계 행성의 움직임은 매우 규칙적이기 때문에 인간의 역동적 움직임을 표현할 때보다 훨씬 더 드문드문한 간격으로 늘어놓아도 쉽게 이해할 수 있다는 것이다(일종의 내삽 혹은 외삽을 통해).
시간의 흐름에 따른 움직임 이외의 사례로는 수천 가지 숫자로 구성된 환자의 진료 기록을 한 페이지짜리 멀티플로 담아낸 예를 소개하고 있다.
아, 그리고 물속에서 다이버들이 봐야하는 일종의 물고기 도감도 예시로 들고 있는데, 여기에서 인상깊었던 점 중 하나는 다이버의 물안경 안에 공기가 들어 있기 때문에 빛의 굴곡이 생기고 결국 물안경이 돋보기 역할을 한다는 사실을 활용하여 한 페이지에 정보를 더 촘촘하게 담아낼 수 있었다는 점이다. 물속에서 페이지를 넘기는 것은 아무래도 불편한데, 물안경의 돋보기 효과를 활용하여 책장 넘길 일을 줄일 수 있었던 것이다. 이 교훈을 일반화하자면 “좋은 디자인을 하려면 해당 정보가 활용될 맥락/상황을 잘 이해하고 이를 활용할 수 있어야 한다” 정도가 되겠다.
7장 - Visual Confection: Juxtapositions from the Ocean of the Streams of Story
마지막 장에서는 컨팩션(영어 사전을 찾아보니 a work of fine of elaborate craftsmanship 이라는 뜻이 있었다)을 다룬다. 컨팩션이란 시공간상의 여러 지점에 분산된 명사들, 동사들, 이야기의 흐름 등을 잘 엮어서 하나의 화면에 담아냄으로써 “좀 더 풍성한 이야기”를 표현하는 기법을 말한다. 도입부에서 예쁜 동화를 인용하고 있는데 함께 읽어보자(알흠다운 글이다):
…the Water Genie told Haroun about the Ocean of the Streams of Story, and even though he was full of a sense of hopelessness and failure the magic of the Ocean began to have an effect on Haroun. He looked into the water and saw that it was made up of a thousand thousand thousand and one different currents, each one a different color, weaving in and out of one another like a liquid tapestry of breathtaking complexity; and the Water Genie explained that these were the Streams of Story, that each colored strand represented and contained a single tale. Different parts of the Ocean contained different sort of stories, and as all the stories that had ever been told and many that were still in the process of being invented could be found here, the Ocean of the Streams of Story was in fact the biggest library in the universe. And because the stories were held here in fluid form, they retained the ability to change, to become new versions of themselves, to join up with other stories and so become yet other stories… —p120
뒷부분에서 언급하는 컴퓨터 인터페이스 이야기도 흥미롭다. 몇 가지 재미있는 주장들(전 대체로 동의하는 편)이 나온다. 이를테면, 컨텐츠를 다루는 애플리케이션에서는 정보 자체가 인터페이스이어야 한다(the information becomes interface)는 주장은 Jef Raskin의 The humane interface와 유사하다고 본다. 저자는 이런 식의 디자인을 information sensitive design으로, 일반적인 방식은 (interface) generic approaches라고 부르고 있다. 컨텐츠 자체가 인터페이스 역할을 하려면 컨텐츠 자체에 대한 깊은 이해가 필요하다고 주장하고 있다(Deadspace 등의 UI 디자인을 떠올려보자. 전반적인 기획 요소에 대한 깊은 이해 없이는 나올 수 없는 인터페이스이다).
컴퓨터 인터페이스의 정보 효율을 정량적으로 평가하기 위한 접근을 소개하고 있는데, 컨텐츠를 나타내는 공간 대비 나머지 관리 인터페이스를 나타내는 공간을 측정하는 방법(Data-ink ratio)와 유사), 종이나 다른 컴퓨터 스크린 대비 활자의 밀도를 측정하는 방법(책 중간에 보면 전화번호부의 활자 밀도와 컴퓨터 사용자 인터페이스)의 활자 밀도를 비교하는 내용이 나온다), 한 화면에서 수행 가능한 명령의 수를 측정하는 방법(미니멀하게 표현될 경우 많을수록 좋다고 한다. Hick’s law 등을 이야기하고 있다.
다음은 책의 마지막 단락이다. 특히 마지막 문장은 컨팩션에 대한 요약이자 어쩌면 책 전체에 대한 요약이기도 하다:
The development of perspective by Florentine architect during the 15th-century Italian Renaissance was a special gift to the world of visual thinking, for now people could see diverse objects located in geometrically correct context. Confectionary designs are a similar gift to understanding. Like perspective, confections give the mind an eye. Confections place selected, diverse images into the narrative context of a coherent argument. And, by virtue of the architecture of their arguments, confections make reading and seeing and thinking identical. —p151
짧은 요약
정보시각화를 할 때, 시각화의 결과물을 볼 때의 태도는 각각 과학적/통계적 추론을 전개하고 평가하는 태도와 같게 할 것. 즉, 중요한 정보가 빠지거나 왜곡되지 않게 할 것, 불필요한 정보가 포함되지 않을 것, 비교 대상 혹은 맥락을 함께 제시할 것, 정보 자체의 진실성에 대해 항상 고민할 것(잘못된 정보를 효과적/효율적으로 전달하면 곤란).
각종 원칙과 기법들:
- The Smallest effective difference: 시각적 재료를 최소한으로 아껴쓰기
- Parallels, Multiples: 병치를 통해 정보를 드러내기
- Confections: 여러 이미지와 글을 세심하게 “조합”하여 풍성한 이야기를 담아내기
아쉬운 점
약간 아쉬운 점도 있다.
첫째, 인간의 시각 시스템이나 인지적 특성에 기반을 둔 접근이 부족한 것 같았다. 이런 부분은 Colin Ware의 저작(예를 들면 Visual thinking for design이나 좀 더 일차적인 저작들(David Marr, J. J. Gibson 등)을 통해 보강하면 좋겠다.
둘째, 컨팩션을 주제로 하는 마지막 장을 빼면 대체로 정보전달의 기계적 효율성에만 너무 치중하고 있다는 느낌이 들었다. 비유하자면 Emotional design 이전의 Donald Norman 같은 느낌이랄까? 실제로 그가 쓰레기(Chartjunk)라고 비판하고 있는 시각화 작품 중 (적어도) 일부에 대해서는 논란이 있기도 하다. 이에 대해서는 데이터 시각화에서 효율성과 아름다움을 참고하기 바란다.
자세한 내용은 Edward Tufte 저작의 아쉬운 점들 참고.